查看原文
其他

计算机识别权威专家领衔爱奇艺AI挑战赛评委会 前沿命题吸引多国团队踊跃报名

共计1000小时、50万条视频片段……爱奇艺(NASDAQ:IQ)不久前发布全球首个多模态、多角度的明星数据集(iQIYI-VID)。该数据集将提供给爱奇艺与中国模式识与计算机视觉大会(PRCV2018)共同举办的“多模态视频人物识别挑战赛”(以下简称挑战赛),通过提供在真实场景下产生的、全角度的视频素材,爱奇艺为参赛选手进行多模态人物识别研究提供实景数据与实验场景。



为了确保此次大赛的权威性,爱奇艺邀请了在计算机视觉研究领域的多位知名学者组成了评委“梦之队”。评委旷视科技的首席科学家、研究院院长孙剑他表示:”人物识别技术孕育了多家相关的人工智能独角兽公司,本质上,我们更关心对人全方位的理解,包括对人的检测、识别、属性、动作分析。爱奇艺举行的“多模态视频人物识别”可以帮助行业更好地实现这个目标。”


此外,此次AI竞赛还获得中国科学院自动化研究所研究员、国家杰出青年科学基金获得者王亮的高度认可。出任评委的他作为电子电气工程师学会(IEEE)高级会员,国际模式识别学会(IAPR)会士,在主要的国内外学术期刊和国际学术会议上发表论文200余篇,谷歌引用1万余次。王亮认为:“多模态人物识别是个重要的、有趣的、却又富于挑战的研究问题。这次大赛开放了全球最大的明星视频数据集(iQIYI-VID),有助于促进人物识别在智能视频分析行业中的实际应用,对参赛选手而言是次同台竞技、交流学习的好机会。只要勇于挑战,一切皆有可能!”同时担任评委的还包括中国科学院计算所研究员、基金委优青、万人计划获得者山世光,爱奇艺CTO刘文峰,爱奇艺副总裁谢丹铭,爱奇艺资深科学家、中国计算机学会视觉专委会副主任王涛等。


截止8月初,该项赛事已经吸引了来自于清华大学、北京大学、纽约大学、新加坡国际大学、瑞典隆德大学、东京工业大学等全球各地数百家顶尖高校与研究机构的参赛团参与。


与大多数计算机视觉识别领域的竞争集中在人脸识别不同,此次爱奇艺AI大赛是全球范围内首个“多模态视频人物识别”领域的科研竞赛。“多模态识别”是指融合行为识别、人脸识别、声纹识别、图片识别等多种识别方式进行综合分析应用。相比静态的图片识别,实际环境下识别效果往往受到多姿态、多表情、多年龄、多光照、多分辨率、不同角色化妆、局部遮挡等影响。目前海量的影视视频数据中,人物识别技术远未达到应用所需的满意精度,在研究上仍具有很大的挑战性。


此前,这一领域研究主要依据学术机构开放的人脸数据集,其中广泛受到认可的为华盛顿大学的MegaFace数据集以及马萨诸塞大学安姆斯特分校的LWF数据集。此次AI大赛中,爱奇艺发布全球首个多模态、多角度的明星数据集(iQIYI-VID)也是目前全球规模最大的视频数据集,而且所有数据都经过人工标注与质量检测,其中包含5000位明星艺人,以及长达1000小时、50万条视频片段。


在视频领域,AI对于影音数据的理解和学习,对于情感信号的细致分析有助于实现更好的内容理解、分发乃至创造和加工内容的能力。爱奇艺近年来不断将多种技术应用于提升用户体验和运营效率。在最近热播的《延禧攻略》、《芸汐传》等爱奇艺热门自制剧中,爱奇艺已将人物智能识别技术应用在了“只看TA”功能中,通过智能识别剧中人物,用户选择“只看TA”功能就可以只观看自己喜欢的演员的视频片段;在大型综艺节目《中国新说唱》的后期制作中,人物识别实现了精彩画面查找功能,后期制作人员通过特定标签,可以在数秒内调出特定表演者的视频素材,以往这个过程需要数小时。


今年爱奇艺世界•大会上,爱奇艺CEO龚宇表示,内容创作者和内容分发平台根据每个用户的需求,为用户创作和分发内容,这将是娱乐行业的质变。

 

爱奇艺正在云计算+大数据+AI的基础上建立起开放服务平台,构造了“AI+软件+硬件”开放生态圈。爱奇艺AI挑战赛继续探索前沿技术与娱乐行业深度结合,在推动前沿技术向前发展的同时,实现AI技术在娱乐生态中的落地应用,整体推动娱乐行业积极向前发展。

 

此次大赛参赛报名截止至9月17日,爱奇艺当日发布测试集,并开始动态排名参赛队的提交结果,提交结果截止时间为10月15日。11月1日,爱奇艺将正式公布AI竞赛结果,并于11月23日举办的中国模式识别与计算机视觉大会(PRCV2018)为获奖队伍颁发奖项。


了解更多,请点击“阅读原文”。

: . Video Mini Program Like ,轻点两下取消赞 Wow ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存